-->
为五月的纽约流媒体保留座位吧. Register Now!

视频:强化学习如何实现个性化观看体验

了解更多关于个性化的信息 流媒体的下一个事件.

阅读这段录音的完整文本:

Rafah Hosn: 这里有另一个可以考虑的解决方案. 这是机器学习的一个新范例,叫做强化学习. 在这里,我们使用真实的终端用户反馈来训练我们的模型. So, how does that work? 让我们再看一下新闻的例子.

We have a user. 他们来到他们最喜欢的新闻网站. 在后台有一个在线学习软件. 无论何时用户进来,用户都有上下文. 这意味着它们有一些特性集, 他们所在的地理位置, 或者他们使用的设备类型. 我们称它为上下文X. Then, inside that red box, there is a policy, a model, 它是根据上下文X为用户选择最好的新故事列表. 我们称之为行动.

强化学习的关键在于我们不会就此止步. 学习者提出一个动作,然后等待用户的反馈. 这就是为什么它被称为强化学习, 因为每次用户点击, 这对在线学习者来说是一种正强化反馈. 这就像教小狗玩把戏一样. 每次小狗做点什么,你就给它一点奖励. 这是一个积极的反馈. 每次小狗做错事,你就说:“坏小狗。.“它不会从中吸取教训. 原理是一样的. 这就是我们用于个性化的范例.

现在,强化学习的关键是一个叫做探索的概念. 给那位问起猫和狗的先生, 至少在我们的强化学习中是这样, 假设你喜欢太空. So in most, 80%的时间我们会为你选择太空文章因为我们知道你喜欢. But add some random .2%, .1%, 2%,我们选一篇不同的文章. 所以,我们会给你看猫,在一些可配置的数字,我们说,“你知道吗? 我们将探索这个空间,看看这位先生是否真的喜欢狗.“所以,我们要让狗看看. 然后我们观察你对狗的反应. 如果你给我们一个积极的反馈,我们会说,“哦,好吧. Okay. 也许不仅仅是猫. 也许他真的有点喜欢狗."

这种探索是非常非常强大的. 这不是完全的随机探索. 它是对一系列可行行动的探索. 所以在新闻的背景下, 你的社论有12个故事列表, 应该在页面上显示的热门故事. So, 80%的时间我们会播放我们认为你喜欢的新闻, 20%我们会随机抽取12篇文章,并提出不同类型的文章,看看用户是否对它有积极的反应. 这就是这个算法的正强化反馈.

事实证明,探索是如此强大,因为它现在允许你自动标记你的数据集. 你不需要花钱标记你的数据集,因为每一个正强化都是一个标签. 任何时候你在探索,你实际上是在增加你的数据集. 所以,这给了你一个非常丰富的数据集,你可以从中学习.

Streaming Covers
Free
合资格订户
Subscribe Now Current Issue Past Issues
Related Articles

视频:演示:如何使您的视频更易于搜索

sechange International高级副总裁, Mark Tubinis演示了如何在2018年流媒体西部视频中使用丰富的元数据进行OTT个性化.

视频:OTT个性化的挑战

sechange International高级副总裁, Mark Tubinis讨论了管理创建个性化OTT体验所需数据的难度.

视频:训练AI的最佳实践

詹森·霍夫曼报道, Citrix' Josh Gray, 和REELY的Cullen Gallagher讨论了2018年流媒体东部培训人工智能系统的最佳实践.

视频:如何知道人工智能何时不能解决你的问题

在2018年流媒体西部大会上,谷歌的马修·洛兰(Matthieu Lorrain)对人工智能的风险提出了警告.

视频:选择视频AI平台时的关键考虑因素

RealEyes技术总监Jun Heider讨论了内部自我评估的重要性,以及在选择视频人工智能平台时要考虑的用例元素.

视频:谁是视频人工智能的关键参与者?

RealEyes Media技术总监Jun Heider在2018年东流媒体大会的视频片段中指出了人工智能平台领域的主要参与者.

视频:开始使用视频AI平台的提示

RealEyes技术总监Jun Heider在2018年流媒体东部会议上的演讲中概述了选择人工智能平台的第一步.

视频:内容个性化的监督机器学习的利弊

微软首席产品经理Rafah Hosn在流媒体东部2018的这段视频中讨论了基于监督机器学习的内容个性化策略的好处和局限性.

视频:微软的定制决策服务如何提高品牌的内容和广告参与度

微软首席产品经理Rafah Hosn解释了微软的机器学习驱动的决策服务如何帮助品牌瞄准观众并提高参与度.

视频:我们如何定义流媒体视频的体验质量?

Comcast技术解决方案架构师Ribal Najjar从主观体验和定性测量两方面定义了视频QoE.

Video: How IRIS.TV在生产环境中实现机器学习

IRIS.TV CEO & 联合创始人讨论IRIS.电视帮助传统媒体公司捕获和利用受众数据和机器学习的方法.

视频:《百家乐软件app最新版下载》如何在2018年冬奥会上利用视频人工智能

甘尼特高级总监卡拉·切尔斯讨论了《百家乐软件app最新版下载》如何利用IRIS.电视和数据本地化和个性化他们的2018年冬季奥运会报道在流媒体东部2018剪辑.

视频:如何使用机器学习来创造个性化的电视体验

ZoneTV的Tom Sauer描述了机器学习如何被用来彻底改变电视世界,并在2018年流媒体东部的这段视频中提供更多个性化的体验.

视频:人工智能如何为你的视频打开新市场

REELY首席执行官卡伦·加拉格尔(Cullen Gallagher)在2018年东流媒体会议上为内容所有者制定人工智能战略提供了业务增长案例.

视频:IBM如何使用视频人工智能

IBM Watson Media的David Clevinger在2018年流媒体东部的这段视频中讨论了媒体实体目前如何使用视频人工智能.

视频:视频人工智能如何帮助企业解读体验指标

Citrix首席架构师Josh Gray在流媒体东2018的这个剪辑中解释了视频如何实现更高灵敏度的指标分析.

视频:视频AI如何提高内容交付效率

Limelight架构副总裁Jason Hofmann在流媒体东部2018的这个剪辑中讨论了AI如何影响内容交付优化.

视频:开发视频机器学习算法的最佳实践

Citrix的Josh Gray提供了关于人工智能模型开发的提示,Reality Software的Nadine Krefetz和IBM的David Clevinger在2018年流媒体东部的这段视频中推测了元数据即服务的可能性.

视频:机器学习将如何影响媒体供应链?

谷歌的Leonidas Kantothanassis在他的内容交付峰会主题演讲中探讨了机器学习在媒体工作流程和供应变化中的广泛应用.